DiSeg: Un segmentador discursivo automático para el español
نویسندگان
چکیده
Nowadays discourse parsing is a very prominent research topic. However, there is not a discourse parser for Spanish texts. The first stage in order to develop this tool is discourse segmentation. In this work, we present DiSeg, the first discourse segmenter for Spanish that uses the framework of the Rhetorical Structure Theory (Mann and Thompson, 1988) and is based on lexical and syntactic rules. We describe the system and we evaluate its performance with a gold standard corpus, obtaining promising results.
منابع مشابه
Poblado automático de ontologías de perfiles académicos a partir de textos en español
Resumen. Este artículo propone un enfoque para el poblado automático de ontologías de perfiles académicos a partir de los textos, expedientes curriculares y resúmenes, de publicaciones científicas en español. El enfoque utiliza reglas semánticas y marcadores lingüísticos para extraer los individuos de clase, relaciones y valores de propiedad. Una evaluación ha sido realizada con un conjunto de ...
متن کاملUna Propuesta para el Etiquetado Automático de Roles Semánticos
Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...
متن کاملArquitectura Web para análisis de sentimientos en Facebook con enfoque semántico
Resumen Actualmente el potencial del análisis automático de sentimientos en redes sociales es relevante en el desarrollo de aplicaciones para múltiples propósitos. En este sentido, las publicaciones en Facebook escritas en español pueden contener información semántica relevante que permitiŕıan clasificarlas en categoŕıas de emociones, la complejidad del idioma hace que el análisis de esta infor...
متن کاملImpacto de la ironía en la minería de opiniones basada en un Léxico Afectivo
En este art́ıculo se describe un método sistemático que identifica la polaridad de textos en Español, aśı como el impacto de la irońıa en la mineŕıa de opiniones. Se propone una aproximación basada en un aprendizaje automático y en la extracción de caracteŕısticas a partir de un Léxico Afectivo en Español. Fue necesaria la creación de un corpus para el entrenamiento y evaluación del método propu...
متن کاملSistema automático para la clasificación de la opinión pública generada en Twitter
Resumen. La facilidad de acceso a la diversidad de contenidos hace de Twitter un medio para pronunciarse sobre temas actuales o eventos en tiempo real. Los usuarios de esta red no cumplen únicamente una función pasiva de recepción y consumo de información, sino que al mismo tiempo se convierten en productores de contenidos. El estudio de tuits requiere de una disciplina que permita trabajar con...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 45 شماره
صفحات -
تاریخ انتشار 2010